Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) espacio semántico (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: espacio semántico


Is in goldstandard

1
paper corpusSignosTxtLongLines176 - : El LSA (del inglés Latent Semantic Analysis) es un tipo de análisis computacional que permite determinar y cuantificar la similitud semántica entre piezas textuales -sean palabras, documentos o palabras y documentos- de un corpus de textos pertenecientes a un mismo dominio de conocimiento. Para ello, el sistema computacional del LSA sigue un algoritmo matemático que tiene como centro a la técnica de factorización lineal conocida como descomposición de valores singulares (SVD, sigla del inglés Singular Value Decomposition), a partir de la cual se genera una representación vectorial del corpus o espacio semántico en cuya conformación y posterior utilización reconocemos dos supuestos lingüísticos acerca del significado: (1 ) el significado es contextualmente dependiente y (2) en el uso contextual hay relaciones de similitud semántica que están latentes.

2
paper corpusSignosTxtLongLines176 - : El grado de similitud semántica entre unidades de significado se establece a través de las tres operaciones con vectores que hemos revisado en párrafos anteriores. Tras ellas, y en la constitución del espacio semántico en general, podemos reconocer que subyacen dos supuestos acerca del significado lingüístico: (1 ) el significado es contextualmente dependiente y (2) en el uso contextual hay relaciones semánticas que están latentes. Estos son los que intentamos sistematizar en los siguientes apartados.

3
paper corpusSignosTxtLongLines176 - : Para emular la representación de este espacio problema en la computadora se siguen pasos idénticos a los que hemos descrito para la conformación del espacio semántico, introduciéndose como única diferencia la caracterización que los creadores del LPSA hacen del corpus de entrenamiento: "LPSA needs a corpus of experience, and does not propose mechanisms to act when there is no experience" (Quesada, 2003a: 17 ). Por corpus de experiencia debemos entender corpus de estados, acciones y eventos que han sido empíricamente derivados, esto es, que han sido obtenidos a partir de la observación directa del desempeño de sujetos que, en situación experimental, enfrentaron una tarea de resolución de problemas (Quesada et al., 2002). El corpus corresponde solo a las posibilidades de actuación efectivamente ejecutadas por los sujetos, es decir, a las posibilidades que se actualizaron en el contexto de la tarea, bajo las restricciones del ambiente y no a todas las posibilidades de acción existentes. Al

4
paper corpusSignosTxtLongLines176 - : Ahora bien, para probar si el LSA puede predecir automáticamente este razonamiento con la misma certeza con que lo han estado haciendo de modo manual, los investigadores conforman un espacio semántico con un corpus de textos de historia antigua tomados de los libros que los estudiantes utilizan en la escuela. Sobre esta base y utilizando la medida de coseno comparan la similitud de las declaraciones de los protocolos verbales de los estudiantes con los textos representados en el espacio semántico, comprobando que el LSA arroja: (a ) cosenos muy altos cuando las declaraciones verbales de los estudiantes son un parafraseo del texto; (b) cosenos muy bajos cuando en las declaraciones predomina información referida al conocimiento previo y, por tanto, se encuentran muy alejadas del texto mismo; y (c) cosenos medios cuando hay equilibrio entre la información textual y el conocimiento previo, es decir, cuando los protocolos verbales muestran una adecuada integración de ambas fuentes de

5
paper corpusSignosTxtLongLines259 - : La primera fila (0,70; 0,64, etc.) representa los cosenos del primer resumen con cada uno de los resúmenes expertos (E1, E2, etc.). La segunda fila lo mismo pero para el segundo resumen. La puntuación final es el coseno medio representado en la última columna. El primer resumen obtiene una calificación de 0,69 y el segundo de 0,34. El primer resumen es mejor porque se parece más a los resúmenes expertos. Una de las ideas fundamentales del LSA, como se ha señalado antes, es que el espacio semántico del LSA recoge la estructura latente y profunda que tienen las palabras, así que no es necesario que el vocabulario recogido en el resumen se solape con el de ningún resumen experto para que el coseno entre sus vectores sea próximo a 1, es decir, para que el resumen sea considerado bueno . Este hecho es realmente lo que le confiere ventaja al LSA sobre otras herramientas, la sutilidad con la que representa el vocabulario en un espacio semántico latente.

6
paper corpusSignosTxtLongLines322 - : la constitución del espacio semántico como en la dimensionalidad del espacio, con el fin de estar seguro de cuál es la cantidad óptima de dimensiones para esta tarea y evaluar si se mantiene la diferencia según la predominancia del texto .

Evaluando al candidato espacio semántico:


1) corpus: 8 (*)
2) resumen: 6
3) significado: 5 (*)
4) similitud: 4 (*)
5) cosenos: 4
7) tarea: 3 (*)
8) textos: 3 (*)
10) posibilidades: 3
12) palabras: 3 (*)
13) semántica: 3 (*)
14) declaraciones: 3
15) coseno: 3 (*)
16) verbales: 3 (*)

espacio semántico
Lengua: spa
Frec: 44
Docs: 7
Nombre propio: / 44 = 0%
Coocurrencias con glosario: 9
Puntaje: 10.032 = (9 + (1+5.70043971814109) / (1+5.49185309632967)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
espacio semántico
: Para Kintsch ([70]2002), lo que hace del LSA tan útil es que permite comparar palabras arbitrarias con el significado de una frase, establece el cuociente de relación entre ellos, y establece qué otras palabras o frases o documentos están cerca de ellos en el espacio semántico.